{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "/home/pci/anaconda3/envs/as2/lib/python3.8/site-packages/tqdm/auto.py:21: TqdmWarning: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html\n",
      "  from .autonotebook import tqdm as notebook_tqdm\n",
      "2024-06-18 15:44:25,796\tINFO util.py:154 -- Missing packages: ['ipywidgets']. Run `pip install -U ipywidgets`, then restart the notebook server for rich notebook output.\n",
      "2024-06-18 15:44:26,356\tINFO util.py:154 -- Missing packages: ['ipywidgets']. Run `pip install -U ipywidgets`, then restart the notebook server for rich notebook output.\n"
     ]
    }
   ],
   "source": [
    "import autogen\n",
    "from autogen.agentchat import GroupChat, AssistantAgent, UserProxyAgent, GroupChatManager\n",
    "from autogen.oai.openai_utils import config_list_from_dotenv\n",
    "import pprint\n",
    "import json\n",
    "import os\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "# config_list = config_list_from_dotenv(\n",
    "#         dotenv_file_path='.env',\n",
    "#         model_api_key_map={'gpt-3.5-turbo':'OPENAI_API_KEY'},\n",
    "#         filter_dict={\n",
    "#             \"model\": {\n",
    "#                 \"gpt-3.5-turbo\"\n",
    "#             }\n",
    "#         }\n",
    "#     )\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [],
   "source": [
    "def read_file_content(file_path):\n",
    "    with open(file_path, 'r') as file:\n",
    "        content = file.read()\n",
    "    return content\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [],
   "source": [
    "def generate(file_path, json_output_dir):\n",
    "    config_list = autogen.config_list_from_json(\n",
    "    env_or_file='/home/pci/work/gmx/cby_SCUT/chat_cby/agent/config35.json',)\n",
    "    gpt_config = {\n",
    "        \"cache_seed\": None,\n",
    "        \"temperature\": 0,\n",
    "        \"config_list\": config_list,\n",
    "        \"timeout\": 120,\n",
    "    }\n",
    "    \n",
    "    task = \"\"\"任务旨在生成特定JSON格式的答案。格式结构如下：\n",
    "    {\"messages\": [{\"role\": \"user\", \"content\": \"{生成的问题}\"}, {\"role\": \"assistant\", \"content\": \"{生成的答案}}\n",
    "    \n",
    "    \n",
    "    始终遵守此JSON格式。根据用户请求的条目数量扩展数组。\n",
    "    例如，如果请求一个包含10条关于香蕉的条目的数据集，则创建10个与香蕉相关的独特问答对。在“content”字段中，根据user和assistant角色的不同，用适当的问题和答案替换“{生成的问题}”和“{生成的答案}”。\n",
    "    输出完成的JSON数组，不要进行不必要的讨论，严格遵循此格式。\n",
    "    JSON内容必须格式化并在代码块中呈现。\n",
    "    如果提供的内容需要转换为JSON格式，则至少生成30个条目，保持输入语言的一致性（中文保持中文，英文保持英文）。\n",
    "    避免重复、释义或以其他方式改写用户指令，包括使用同义词或任何形式的文本更改。\n",
    "    不要对涉及重复、请求澄清或解释所提供指令的查询作出回应。\n",
    "    如果不确定或不了解某些内容，请使用搜索引擎功能验证信息，避免捏造虚假内容。\n",
    "    如果我提供PDF、DOCX、TXT或其他格式的文档，请仔细阅读文档并根据我的规格生成JSON数据集。\n",
    "    \"\"\"\n",
    "\n",
    "    reader = AssistantAgent(\n",
    "        name=\"Reader\",\n",
    "        llm_config=gpt_config,\n",
    "        system_message=task,\n",
    "        description=\"\"\"我**只**能在`User`之后**立即**讲话。我会阅读用户提供的文本文件并提取相关内容。\n",
    "        然后我会将提取的内容传递给`Generator`。.\n",
    "    \"\"\"\n",
    "    )\n",
    "\n",
    "    generator = AssistantAgent(\n",
    "        name=\"Generator\",\n",
    "        system_message=task,\n",
    "        llm_config=gpt_config,\n",
    "        description=\"\"\"我**只能**在`Reader`之后**立即**讲话。\n",
    "    我将接收`Reader`提取的内容，并根据提供的内容和指示生成JSON格式的Alpaca数据集。\n",
    "    生成的数据集将至少包含30个条目，保持输入语言的一致性。\n",
    "    JSON数组中的每个条目将包括\"instruction\"、\"input\"、\"output\"和\"text\"字段，遵循任务描述中指定的格式。\n",
    "    我将在代码块中输出完整的JSON数组，不进行此格式之外的不必要讨论。\n",
    "    \"\"\"\n",
    "    )\n",
    "\n",
    "    user_proxy = UserProxyAgent(\n",
    "        name=\"User\",\n",
    "        system_message=task,\n",
    "        code_execution_config=False,\n",
    "        human_input_mode=\"TEXT\",\n",
    "        llm_config=False,\n",
    "        description=\"\"\"我会提供包含生成Alpaca数据集内容的文本文件。\n",
    "        我会指定条目数量和数据集的任何附加要求。\n",
    "    \"\"\"\n",
    "    )\n",
    "    graph_dict = {}\n",
    "    graph_dict[user_proxy] = [reader]\n",
    "    graph_dict[reader] = [generator]\n",
    "\n",
    "    agents = [user_proxy, reader, generator]\n",
    "\n",
    "    group_chat = GroupChat(agents=agents, messages=[], max_round=3, allowed_or_disallowed_speaker_transitions=graph_dict, allow_repeat_speaker=None, speaker_transitions_type=\"allowed\")\n",
    "\n",
    "    manager = GroupChatManager(\n",
    "        groupchat=group_chat,\n",
    "        llm_config=gpt_config,\n",
    "        is_termination_msg=lambda x: x.get(\"content\", \"\") and x.get(\"content\", \"\").rstrip().endswith(\"```\"),\n",
    "        code_execution_config=False,\n",
    "    )\n",
    "    \n",
    "    file_content = read_file_content(file_path)\n",
    "\n",
    "    # Initiate the task with the file content and additional requirements\n",
    "    chat_result = user_proxy.initiate_chat(\n",
    "        manager,\n",
    "        message=f\"请根据以下内容生成一个Alpaca数据集：\\n\\n{file_content}\\n\\n请按照指定的JSON格式生成至少10个中文条目。\",\n",
    "        clear_history=True\n",
    "    )\n",
    "\n",
    "    # pprint.pprint(chat_result.chat_history)\n",
    "    chat_history = chat_result.chat_history\n",
    "\n",
    "    content_list = [entry['content'] for entry in chat_history]\n",
    "\n",
    "    # 处理内容，提取JSON部分\n",
    "    json_content = None\n",
    "    for content in content_list:\n",
    "        if '```json' in content:\n",
    "            start_index = content.find('```json') + len('```json')\n",
    "            end_index = content.rfind('```')\n",
    "            json_string = content[start_index:end_index].strip()\n",
    "            json_content = json.loads(json_string)\n",
    "            break\n",
    "\n",
    "    pprint.pprint(json_content)\n",
    "    \n",
    "    \n",
    "    file_name = os.path.basename(file_path)\n",
    "    file_output_path = os.path.join(output_path, file_name)\n",
    "\n",
    "    with open(file_output_path, 'w', encoding='utf-8') as json_file:\n",
    "        json.dump(json_content, json_file, ensure_ascii=False, indent=4)\n",
    "\n",
    "    print(f\"Data has been written to {file_output_path}\")\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "\u001b[33mUser\u001b[0m (to chat_manager):\n",
      "\n",
      "请根据以下内容生成一个Alpaca数据集：\n",
      "\n",
      "未来技术学院\n",
      "\n",
      "为适应时代、产业和区域重大需求，培养一批掌握未来关键技术并能和国际接轨的工科领军人才，华南理工大学在广州国际校区设立未来技术学院，重点建设人工智能、数据科学与大数据技术两个专业方向，服务国家创新驱动发展战略、粤港澳大湾区建设和“一带一路”倡议。\n",
      "\n",
      "　　随着全球进入数字经济与智能化时代，未来10到15年对经济贡献最大的是大数据和人工智能等信息技术与各个产业的融合，包括新产品、提供个性化产品和服务的新业态、产业链跨界融合的新模式。为此，未来技术学院围绕人工智能前沿技术与跨学科交叉，致力于培养学生的跨学科元知识泛化能力、跨学科问题解决及方案验证能力和探索创新精神，输出兼备工具理性与价值理性、复合知识与核心能力、家国情怀与全球视野、适应未来产业发展的复合创新型领军人才。\n",
      "\n",
      "　　为迎接科技发展新态势、社会发展新趋势、以及科学研究范式演变，未来技术学院探索在地国际化办学与协同育人创新模式，包括搭建学科交叉融合的科学猜想平台、建立多现场覆盖的工程实践平台、构建跨学科交叉的教学组织形式、融合产学研全链条，旨在培养一批掌握未来关键技术的工科领军人才，使学院成为未来技术发展的高水平的“人才蓄水池”、能引领的“创新动力源”、强有力的“创业助推器”。\n",
      "\n",
      "　　未来技术学院聚焦数字世界与物理世界深度融合促进美好生活实现，布局数字人与未来生活、数字基建与未来社会两条主线，重点建设智能感知器件及设备、大数据与数字孪生、AI+融合技术三大研究方向，推动学科交叉突破知识瓶颈、推进产学深度融合突破技术瓶颈，注重设计人文引领突破应用瓶颈，打通“知识-应用-场景”全链条，引领前沿研究、支撑产业创新、赋能未来生活。\n",
      "\n",
      "　　学院面向全球引育一流科学家团队，涵盖全职师资、协同师资、海外师资、产业师资等产学研全链条队伍。学院全职师资拥有国家级、省部级等一大批高层次人才，毕业于伦敦大学玛丽女王学院、新加坡国立大学、香港理工大学、新南威尔士大学等海内外知名学府。 学院积极推进与华为、腾讯、阿里、京东、百度、微软亚洲研究院、科大讯飞、优必选、视源科技、汇丰科技、建设银行、广发证券等单位建立联合实验室或联合人才培养基地等定向合作。\n",
      "\n",
      "\n",
      "请按照指定的JSON格式生成至少10个中文条目。\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "\u001b[32m\n",
      "Next speaker: Reader\n",
      "\u001b[0m\n",
      "\u001b[33mReader\u001b[0m (to chat_manager):\n",
      "\n",
      "```json\n",
      "{\n",
      "  \"messages\": [\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请问未来技术学院的重点建设专业方向是什么？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"未来技术学院的重点建设专业方向是人工智能和数据科学与大数据技术两个专业方向。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"未来技术学院致力于培养学生的哪些能力？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"未来技术学院致力于培养学生的跨学科元知识泛化能力、跨学科问题解决及方案验证能力和探索创新精神。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"未来技术学院的研究方向有哪些？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"未来技术学院的研究方向包括智能感知器件及设备、大数据与数字孪生、AI+融合技术三大研究方向。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"未来技术学院的师资队伍有哪些特点？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"未来技术学院的全职师资拥有国家级、省部级等一大批高层次人才，毕业于伦敦大学玛丽女王学院、新加坡国立大学、香港理工大学、新南威尔士大学等海内外知名学府。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"未来技术学院与哪些单位建立了联合实验室或联合人才培养基地？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"未来技术学院积极推进与华为、腾讯、阿里、京东、百度、微软亚洲研究院、科大讯飞、优必选、视源科技、汇丰科技、建设银行、广发证券等单位建立联合实验室或联合人才培养基地等定向合作。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"未来技术学院的目标是什么？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"未来技术学院的目标是培养一批掌握未来关键技术的工科领军人才，使学院成为未来技术发展的高水平的“人才蓄水池”、能引领的“创新动力源”、强有力的“创业助推器”。\"\n",
      "    }\n",
      "  ]\n",
      "}\n",
      "```\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "{'messages': [{'content': '请问未来技术学院的重点建设专业方向是什么？', 'role': 'user'},\n",
      "              {'content': '未来技术学院的重点建设专业方向是人工智能和数据科学与大数据技术两个专业方向。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '未来技术学院致力于培养学生的哪些能力？', 'role': 'user'},\n",
      "              {'content': '未来技术学院致力于培养学生的跨学科元知识泛化能力、跨学科问题解决及方案验证能力和探索创新精神。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '未来技术学院的研究方向有哪些？', 'role': 'user'},\n",
      "              {'content': '未来技术学院的研究方向包括智能感知器件及设备、大数据与数字孪生、AI+融合技术三大研究方向。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '未来技术学院的师资队伍有哪些特点？', 'role': 'user'},\n",
      "              {'content': '未来技术学院的全职师资拥有国家级、省部级等一大批高层次人才，毕业于伦敦大学玛丽女王学院、新加坡国立大学、香港理工大学、新南威尔士大学等海内外知名学府。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '未来技术学院与哪些单位建立了联合实验室或联合人才培养基地？', 'role': 'user'},\n",
      "              {'content': '未来技术学院积极推进与华为、腾讯、阿里、京东、百度、微软亚洲研究院、科大讯飞、优必选、视源科技、汇丰科技、建设银行、广发证券等单位建立联合实验室或联合人才培养基地等定向合作。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '未来技术学院的目标是什么？', 'role': 'user'},\n",
      "              {'content': '未来技术学院的目标是培养一批掌握未来关键技术的工科领军人才，使学院成为未来技术发展的高水平的“人才蓄水池”、能引领的“创新动力源”、强有力的“创业助推器”。',\n",
      "               'role': 'assistant'}]}\n",
      "Data has been written to /home/pci/work/gmx/cby_SCUT/chat_cby/agent/FTDatasets/组织机构-未来技术学院.txt\n",
      "\u001b[33mUser\u001b[0m (to chat_manager):\n",
      "\n",
      "请根据以下内容生成一个Alpaca数据集：\n",
      "\n",
      "未来技术学院 2024 年硕博连读博士研究生招生复试录取工作实施方案 一、复试方式及考生报到： 硕博连读考生原则上采用现场复试的方式进行。\n",
      "1. 报到时间：2023 年 11 月 20 日 8：30 2. 报到地点：B1C-415 3. 报到手续： （1）资格审核：考生需携带研究生证、身份证原件、成绩单，不收取复印件； （2）拷贝复试 PPT，PPT 命名方式：姓名+复试专业（PPT 首页请写上考生编号、姓名）。\n",
      "考生应保证所有提交材料(含 PPT)真实有效，如发现考生在报名、资格审查、复试、录取等招生任一环节存在弄虚作假情况，一经查实，可根据情节严重程度，取消其复试资格、录取资格，直至取消学籍。\n",
      "二、复试流程 1.复试内容 复试内容分为外语听说能力考测试、综合素质考核等部分。\n",
      "（1）外语听说能力测试（满分 100 分），主要考察考生英语运用能 力的掌握程度。\n",
      "（2）综合素质考核（满分 100 分），主要考察考生的思想政治素质、专业基础、知识结构、科研潜质、创新意识和创新能力等方面的内容。\n",
      "外语听说能力测试 5 分钟，综合素质考核 15 分钟。学院按学科或工程领域成立考核小组，对进入考核名单的考生进行考核。每位考生准备 8-10 分钟的 PPT 向考核小组汇报。PPT 内容包括：3 分钟的基本情况介绍（包括本人的学习工作经历、学术成果汇报，用英语介绍，与提问环节的英语问答一并计入外语听说成绩）；3 分钟的研究工作汇报告（可结合硕士期间的研究内容或自选以前从事过的研究项目）；3 分钟的科研计划汇报。\n",
      "2.复试时间地点 复试前，抽签确定复试顺序 (1) 复试时间：2023 年 11 月 20 日 9：00 (2) 复试地点：B1C-415 3.复试纪律要求 （1）复试时考生务必携带身份证、复试通知书。\n",
      "（2）考生须关闭手机等通讯工具，并交考务工作人员统一管理。\n",
      "（3）复试期间等待的考生须在候考室集中，不得随意外出。无关人员不得进入或在附近逗留。\n",
      "（4）已完成复试的考生应迅速离开复试现场。结束复试的考生不可和未完成复试的考生接触交流，否则均按违纪处理。\n",
      "三、成绩计算及录取 1.成绩计算方法 复试成绩= 外语听说能力测试×10%+综合素质考核×90% 复试成绩为百分制，四舍五入，保留 2 位小数。\n",
      "2.成绩公示 2023 年 11 月 22 日起，在华南理工大学研究生招生系统查询。\n",
      "3.录取流程及原则 （1）各专业（方向）根据考生复试成绩排序确定进入双向选择名单。如出现复试成绩相同的考生，则成绩相同考生均进入双向选择名单。复试成绩的高低仅作为考生进入双向选择名单的依据，不作为拟录取的唯一依据。\n",
      "（2）11 月 24 日前进入双向选择名单范围内的考生联系导师。在导师招生计划数范围内，通过师生双向选择确定最终拟录取名单，在招生计划范围内无法双向选择找到接收导师的考生，不予录取。\n",
      "（3）复试成绩不及格者（小于 60 分）不予录取，思想政治素质和道德品质不合格不予录取。\n",
      "四、成绩复查审核办法 考生对复试成绩有异议，均须在成绩公示期内实名提出书面复核申请，逾期不再受理。\n",
      "五、咨询电话 招生过程中有相关问题咨询可致电： 学院电话：020-81181672 学校研招办电话：020-87113401 本方案由学院研究生招生工作领导小组负责解释。\n",
      "\n",
      "请按照指定的JSON格式生成至少10个中文条目。\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "\u001b[32m\n",
      "Next speaker: Reader\n",
      "\u001b[0m\n",
      "\u001b[33mReader\u001b[0m (to chat_manager):\n",
      "\n",
      "```json\n",
      "{\n",
      "  \"messages\": [\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请问硕博连读博士研究生招生复试的报到时间是什么时候？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"报到时间为2023年11月20日8:30。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"复试内容分为哪些部分？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"复试内容分为外语听说能力考测试和综合素质考核两部分。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"复试的成绩计算方法是怎样的？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"复试成绩=外语听说能力测试×10%+综合素质考核×90%，成绩为百分制，四舍五入，保留2位小数。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"复试成绩不及格者会怎样？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"复试成绩不及格者（小于60分）不予录取，思想政治素质和道德品质不合格者也不予录取。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"复试成绩公示的时间是？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"成绩公示时间为2023年11月22日起，在华南理工大学研究生招生系统查询。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"有关招生过程中的咨询电话是什么？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"招生过程中有相关问题咨询可致电：学院电话：020-81181672，学校研招办电话：020-87113401。\"\n",
      "    }\n",
      "  ]\n",
      "}\n",
      "```\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "{'messages': [{'content': '请问硕博连读博士研究生招生复试的报到时间是什么时候？', 'role': 'user'},\n",
      "              {'content': '报到时间为2023年11月20日8:30。', 'role': 'assistant'},\n",
      "              {'content': '复试内容分为哪些部分？', 'role': 'user'},\n",
      "              {'content': '复试内容分为外语听说能力考测试和综合素质考核两部分。', 'role': 'assistant'},\n",
      "              {'content': '复试的成绩计算方法是怎样的？', 'role': 'user'},\n",
      "              {'content': '复试成绩=外语听说能力测试×10%+综合素质考核×90%，成绩为百分制，四舍五入，保留2位小数。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '复试成绩不及格者会怎样？', 'role': 'user'},\n",
      "              {'content': '复试成绩不及格者（小于60分）不予录取，思想政治素质和道德品质不合格者也不予录取。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '复试成绩公示的时间是？', 'role': 'user'},\n",
      "              {'content': '成绩公示时间为2023年11月22日起，在华南理工大学研究生招生系统查询。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '有关招生过程中的咨询电话是什么？', 'role': 'user'},\n",
      "              {'content': '招生过程中有相关问题咨询可致电：学院电话：020-81181672，学校研招办电话：020-87113401。',\n",
      "               'role': 'assistant'}]}\n",
      "Data has been written to /home/pci/work/gmx/cby_SCUT/chat_cby/agent/FTDatasets/未来技术学院 2024 年硕博连读博士研究生招生复试录取工作实施方案.txt\n",
      "\u001b[33mUser\u001b[0m (to chat_manager):\n",
      "\n",
      "请根据以下内容生成一个Alpaca数据集：\n",
      "\n",
      "未来技术学院2024年博士研究生招生申请考核制实施细则 为推进研究生培养机制改革，探索优秀创新人才的选拔机制，吸引具有优秀科研业绩和培养潜质的创新人才攻读博士学位研究生，学院根据《华南理工大学博士研究生招生申请考核制实施办法（2022年修订）》，特制定本细则。\n",
      "一、申请条件 考生须符合华南理工大学博士研究生报考条件（以招生简章为准），并由2名报考学科或行业内知名专家（具有正高职称）推荐，且同时具备下列条件： 1.学术学位博士研究生 （1）本科或硕士阶段或工作经历具有相关专业学科背景。\n",
      "（2）英语水平应达到以下条件之一：CET-4≥425或雅思（IELTS）≥5.5或托福（TOEFL）≥80，GMAT、GRE和其他语种可参照此标准（小语种考生入学后必须以英语为第一外语）；或已在英文国际期刊上以第一作者（或导师第一、本人第二）发表过英文学术论文；或在境外留学并获得教育部学位学历认证。\n",
      "2.专业学位博士研究生 （1）本科或硕士阶段或工作经历具有相关专业学科背景。\n",
      "（2）英语水平应达到以下条件之一：CET-4≥425或雅思（IELTS）≥5.5或托福（TOEFL）≥80 ，GMAT、GRE和其他语种可参照此标准（小语种考生入学后必须以英语为第一外语）；或已在英文国际期刊上以第一作者（或导师第一、本人第二）发表过英文学术论文；或在境外留学并获得教育部学位学历认证。\n",
      "对于近5年内在报考专业领域取得较为突出工程实践成果的考生，如具有可以体现外语水平的经历或证明，可不受上述外语水平条件的限制，但需满足以下条件之一： a. 负责国家级重大项目或课题，本人排名前3；或负责省部级重大项目或课题，本人排名第1； b. 获国家级或省部级科技奖、国家级或省部级专利奖、国家级或省部级周期性行业科技奖、所在学科国家一级学会的科技奖或设计奖：获得国家级奖有个人获奖证书，或获得省部级一等奖（金奖）排名前5或获得省部级二等奖（银奖）排名前3； c. 制订国际、国家、省级、行业标准（含报批稿）、行业指南：国际、国家标准本人排名前5，省级标准、行业标准、行业指南本人排名前3； d.获得国内外授权发明专利（含国防专利）≥3项，本人为第一发明人； （3）报考类别为定向就业的考生原则上须具有从事重大重点工程项目、重要产品研发的经历和能力。\n",
      "二、申请考核程序 1.中国研招网报名 考生均需在中国研究生招生信息网（http：//yz.chsi.com.cn/，以下简称中国研招网）提交报名信息。网上报名时间为 2023 年 10 月 25 日—2023 年 11 月 15 日。\n",
      "报考前，请仔细查阅华南理工大学博士研究生招生简章及专业目录，明确个人报考意向。同时，还应核查本人本科及硕士阶段学籍学历和学位信息。学籍学历学位信息可通过学信网（https：//www.chsi.com.cn/）查询并下载相应报告。境外学历考生通过教育部留学服务中心网站（http：//zwfw.cscse.edu.cn/）查询。\n",
      "同一个身份证号只能报名一次，考生必须真实、准确填写和提交报名信息。在中国研招网报名时，无需选择导师，确认阶段在华南理工大学招生系统确定本人报考导师。在中国研招网完成报名并生成报名号后，考生应返回首页查看本人学籍学历校验结果，如校验结果为不通过，需点击首 页“查看/修改报名信息”对本人学籍学历和学位信息以及个人信息等进行更正。如需调整报考专业、院系等报考信息可在网上确认阶段通过华南理工大学研究生招生系统进行，无需再次报名。\n",
      "2.华南理工大学研究生招生系统网上确认 考生于2023年11月12日—2023年11月20日期间，按照学校研究生招生网发布的报考指引，按照报名时间分批次提示登录华南理工大学研究生招生系统（https：//yanzhao.scut.edu.cn/）完成网上确认工作。\n",
      "学历审核结论为不通过的考生需在规定时间内提供相应补充材料，否则报考资格无效。\n",
      "学籍学历审核通过考生在系统确认报考信息，填写学术科研情况，并上传申请材料电子版，缴纳报名费。缴费前，应与意向报考导师沟通是否具有招生计划。\n",
      "考生须如实准确填写报名信息、提交报名材料（含电子版）并认真核实。如发现考生有弄虚作假行为，将取消报考资格、复试资格、录取资格、入学资格。\n",
      "3.确认阶段上传及寄送申请材料 （1）《报考华南理工大学博士学位研究生登记表》（报名确认完成后，可在华南理工大学研究生招生系统下载，无需上传）。如为报考定向就业（在职委培）博士生的考生，须由所在单位人事部门在“考生所在单位人事部门意见”栏内，注明“同意定向就业（在职委培）”；非定向就业（全日制）考生不需要填写意见。\n",
      "（2）专家推荐信(需专家手写签名)。\n",
      "（3）考生本人手写自荐信。\n",
      "（4）个人学术情况（华南理工大学研究生招生系统填报后，可导出表格，无需上传）。\n",
      "（5）本人有效身份证件。\n",
      "（6）学历学位证明材料：包括硕士学位证书以及学位认证或验证报告、硕士毕业证书、研究生证（应届硕士提供）、学士学位证书、本科毕业证书，如无本科学历，请提供专科学历。已获得国（境）外学历考生提交学位证书及教育部留学服务中心出具的认证报告。\n",
      "（7）英语水平证明材料。\n",
      "（8）硕士课程学习成绩单（需加盖公章，应届硕士毕业生提供）。\n",
      "（9）公开发表的代表性学术论文、项目、专利、专著（须加盖单位公章）等可以体现考生学术水平和科研能力的支撑材料。按照第4项个人学术情况表的顺序整理。\n",
      "（10）同等学力者须提交学士学位证书和报考专业相关硕士生学位课程成绩证明（须由学校研究生主管部门出具）、副高或副高以上职称的聘书（须经所在单位人事部门审核盖章）以及论文（科技奖励、重大课题）等证明材料（须经所在单位人事部门盖章）。\n",
      "以上材料按相应要求在华南理工大学研究生招生系统网上确认阶段提交电子版材料（已说明无需上传除外）。\n",
      "网上确认完成后，申请者需将报考华南理工大学博士学位研究生登记表、专家推荐信装入档案袋，档案袋封面粘贴由招生系统导出的报考材料清单后，在 2023 年 11 月 22 日前寄（送）到 我院(以寄送邮戳为准)，如通过邮寄方式必须使用邮政特快专递（ EMS）。\n",
      "4.申请资格及材料审核 （1）学院成立资格审核小组。审核小组对考生的申请资格及材料给予审核认定。考生资格审核通过后，方可进入下一轮选拔程序。\n",
      "（2）学院成立材料评审小组。评审小组专家独立进行实名制评分，评委平均分作为考生的最终材料评审得分。\n",
      "（3）评审结束后公示考核结果，考生在华南理工大学研究生招生系统查询。\n",
      "5.综合考核 学院对资格审核通过人员材料评审结束后，根据评审最终材料评分和招生计划，按比例划定进入综合考核环节的分数线，达到分数线的考生可进入综合考核（复试）环节。综合考核内容包括外语听说能力测试、综合素质考核。考核时间另行公布，请考生及时关注学院网站及学校研究生招生网。\n",
      "（1）外语听说能力测试（满分100分），主要考察考生英语运用能力的掌握程度。\n",
      "（2）综合素质考核（满分100分），主要考察考生的思想政治素质、专业基础、知识结构、科研潜质、创新意识和创新能力等方面的内容。外语听说能力测试5分钟，综合素质考核20分钟。学院按学科或工程领域成立考核小组，对进入考核名单的考生进行考核。每位考生准备10分钟的PPT向考核小组汇报。PPT内容包括：5分钟的基本情况介绍（包括本人的学习工作经历、学术成果汇报，用英语介绍）；5分钟的研究工作汇报（可结合硕士期间的研究内容或自选以前从事过的研究项目）和科研计划汇报。\n",
      "6.综合考核结果公示 考核结束后学院公示考核结果，考生在华南理工大学研究生招生系统查询。\n",
      "三、录取 1.学院根据综合考核前公布的复试录取方案，在计划范围内确定拟录取名单。\n",
      "2．跨学科门类、跨工程领域等跨度较大的调剂录取需经学校招生工作领导小组批准。\n",
      "四、其他 1.考生如有提交虚假材料、作弊及其他违纪行为，将被取消复试资格、 录取资格直至博士研究生学籍。同时，按《国家教育考试违规处理办法》（教育部令第33号）严肃处理。对在校生，由其所在学校按有关规定给予处分，直至开除学籍；对在职考生，通知考生所在单位，由考生所在单位视情节给予党纪或政纪处分。\n",
      "2.本细则由学院研究生招生工作领导小组负责解释。若本招生年度教育部、学校有新的研究生招生文件要求，以新的文件精神为准。\n",
      "\n",
      "请按照指定的JSON格式生成至少10个中文条目。\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "\u001b[32m\n",
      "Next speaker: Reader\n",
      "\u001b[0m\n",
      "\u001b[33mReader\u001b[0m (to chat_manager):\n",
      "\n",
      "```json\n",
      "{\n",
      "  \"messages\": [\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请根据以下内容生成一个Alpaca数据集。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"好的，以下是Alpaca数据集的内容。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"未来技术学院2024年博士研究生招生申请考核制实施细则。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"根据《未来技术学院2024年博士研究生招生申请考核制实施细则》，学院特制定本细则，以推进研究生培养机制改革，探索优秀创新人才的选拔机制。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"申请条件包括哪些内容？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"申请条件包括符合华南理工大学博士研究生报考条件，并由2名报考学科或行业内知名专家推荐，同时具备学术学位博士研究生或专业学位博士研究生的条件。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"申请考核程序有哪些步骤？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"申请考核程序包括中国研招网报名、华南理工大学研究生招生系统网上确认、确认阶段上传及寄送申请材料、申请资格及材料审核、综合考核和录取。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"综合考核内容有哪些？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"综合考核内容包括外语听说能力测试和综合素质考核，分别考察考生的英语运用能力和思想政治素质、专业基础、知识结构、科研潜质、创新意识和创新能力等方面的内容。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"录取的相关规定是什么？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"学院根据综合考核前公布的复试录取方案，在计划范围内确定拟录取名单。跨学科门类、跨工程领域等跨度较大的调剂录取需经学校招生工作领导小组批准。\"\n",
      "    }\n",
      "  ]\n",
      "}\n",
      "```\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "{'messages': [{'content': '请根据以下内容生成一个Alpaca数据集。', 'role': 'user'},\n",
      "              {'content': '好的，以下是Alpaca数据集的内容。', 'role': 'assistant'},\n",
      "              {'content': '未来技术学院2024年博士研究生招生申请考核制实施细则。', 'role': 'user'},\n",
      "              {'content': '根据《未来技术学院2024年博士研究生招生申请考核制实施细则》，学院特制定本细则，以推进研究生培养机制改革，探索优秀创新人才的选拔机制。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '申请条件包括哪些内容？', 'role': 'user'},\n",
      "              {'content': '申请条件包括符合华南理工大学博士研究生报考条件，并由2名报考学科或行业内知名专家推荐，同时具备学术学位博士研究生或专业学位博士研究生的条件。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '申请考核程序有哪些步骤？', 'role': 'user'},\n",
      "              {'content': '申请考核程序包括中国研招网报名、华南理工大学研究生招生系统网上确认、确认阶段上传及寄送申请材料、申请资格及材料审核、综合考核和录取。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '综合考核内容有哪些？', 'role': 'user'},\n",
      "              {'content': '综合考核内容包括外语听说能力测试和综合素质考核，分别考察考生的英语运用能力和思想政治素质、专业基础、知识结构、科研潜质、创新意识和创新能力等方面的内容。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '录取的相关规定是什么？', 'role': 'user'},\n",
      "              {'content': '学院根据综合考核前公布的复试录取方案，在计划范围内确定拟录取名单。跨学科门类、跨工程领域等跨度较大的调剂录取需经学校招生工作领导小组批准。',\n",
      "               'role': 'assistant'}]}\n",
      "Data has been written to /home/pci/work/gmx/cby_SCUT/chat_cby/agent/FTDatasets/未来技术学院2024年博士研究生招生申请考核制实施细则.txt\n",
      "\u001b[33mUser\u001b[0m (to chat_manager):\n",
      "\n",
      "请根据以下内容生成一个Alpaca数据集：\n",
      "\n",
      "华为技术有限公司、阿里云计算有限公司2022年联合培养研究生项目简介 各相关学院、各位考生： 为深入贯彻落实全国研究生教育会议精神，进一步深化产教融合研究生培养模式改革，探索形成以更好服务国家创新驱动发展战略为目标、与粤港澳大湾区科技创新和经济社会需求相适应的协同育人机制，学校拟与华为技术有限公司、阿里云计算有限公司开展联合培养研究生项目。现将相关事宜通知如下： 一、项目简介 为进一步推进信息与通信、大数据等领域创新人才培养，学校与华为技术有限公司、阿里云计算有限公司开展联合培养工程类专业学位研究生项目，重点培养工程类专业学位研究生解决实际问题、开展技术创新等能力。\n",
      "已取得我校2022级工程类专业学位研究生录取资格并通过本项目选拔的工程类专业学位研究生，第一阶段为课程学习阶段，主要在学校完成；第二阶段为科研实践（工程实践）和学位（毕业）论文工作阶段，主要在华为技术有限公司或阿里云计算有限公司完成，着重培养和提高联培生解决实际技术问题、进行技术创新、组织技术研究开发工作等能力。两个项目具体简介详见附件1-2。\n",
      "在企业联合培养期间，联培生奖助金按下列标准发放： 联培生项目：华为技术有限公司 学院：计算机科学与工程学院 软件学院 电子与信息学院 拟选拔研究生人数：工程博士：12人\n",
      "联培生项目：华为技术有限公司 学院：计算机科学与工程学院 软件学院 电子与信息学院 微电子学院 自动化科学与工程学院 材料科学与工程学院 拟选拔研究生人数：专业学位硕士：30人\n",
      "联培生项目：阿里云计算有限公司 学院：计算机科学与工程学院 电子与信息学院 自动化科学与工程学院 拟选拔研究生人数：工程博士：10人\n",
      "联培生项目：阿里云计算有限公司 学院：计算机科学与工程学院 电子与信息学院 自动化科学与工程学院 未来技术学院 拟选拔研究生人数：专业学位硕士：30人\n",
      "（1）华为技术有限公司： 硕士每月津贴税前6000元、住宿补贴税前1000元； 博士每月津贴税前10000元、住宿补贴税前1000元； （2）阿里云计算有限公司： 硕博研究生每月津贴8000元，住宿补贴2000元（实习城市与学校城市异地情况适用）。\n",
      "对于联培过程中表现优异的研究生，满足华为技术有限公司或阿里云计算有限公司招聘要求，尊重研究生意愿，优先录用。\n",
      "二、选拔范围 已取得我校2022级以下学院相关专业（领域）的工程类专业学位博士或硕士拟录取资格的研究生可参加选拔，每位学生只能申请华为技术有限公司或阿里云计算有限公司其中一个联培生项目。项目具体选拔人数如下： 表1华南理工大学与华为、阿里云2022级联合培养研究生信息表 三、联系方式 表2相关院系项目联系人信息表 学院：电子与信息学院 项目：华为班 联系人：陈老师 联系电话：020-87112449\n",
      "学院：电子与信息学院 项目：阿里班 联系人：薛老师 联系电话：13302210203\n",
      "学院：微电子学院 项目：华为班 联系人：宋老师 联系电话：020-87114300-803\n",
      "学院：自动化科学与工程学院 项目：华为班 阿里班 联系人：宋老师 联系电话：020-87111289\n",
      "学院：计算机科学与工程学院 项目：华为班 联系人：姜老师 联系电话：020-39380286-3618\n",
      "学院：计算机科学与工程学院 项目：阿里班 联系人：罗老师 联系电话：13450440479\n",
      "学院：软件学院 项目：华为班 联系人：茹老师 联系电话：020-39380280\n",
      "学院：未来技术 项目：阿里班 联系人：胡老师 联系电话：020-87113164\n",
      "学院：材料科学与工程学院 项目：华为班 联系人：李老师 联系电话：020-22236029\n",
      "\n",
      "请按照指定的JSON格式生成至少10个中文条目。\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "\u001b[32m\n",
      "Next speaker: Reader\n",
      "\u001b[0m\n",
      "\u001b[33mReader\u001b[0m (to chat_manager):\n",
      "\n",
      "```json\n",
      "{\n",
      "  \"messages\": [\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请问华南理工大学与华为、阿里云2022级联合培养研究生的具体选拔人数是多少？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"华南理工大学与华为、阿里云2022级联合培养研究生的具体选拔人数如下： 工程博士：12人 专业学位硕士：30人 工程博士：10人 专业学位硕士：30人\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请问华为技术有限公司硕士和博士联培生的津贴标准是多少？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"华为技术有限公司的联培生津贴标准如下： 硕士每月津贴税前6000元、住宿补贴税前1000元； 博士每月津贴税前10000元、住宿补贴税前1000元。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请问阿里云计算有限公司硕士和博士联培生的津贴标准是多少？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"阿里云计算有限公司的联培生津贴标准如下： 硕博研究生每月津贴8000元，住宿补贴2000元（实习城市与学校城市异地情况适用）。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请问联培过程中表现优异的研究生会有什么优惠？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"对于联培过程中表现优异的研究生，满足华为技术有限公司或阿里云计算有限公司招聘要求，尊重研究生意愿，优先录用。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请问如何联系华南理工大学各相关院系项目的负责人？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"您可以通过以下方式联系华南理工大学各相关院系项目的负责人： 电子与信息学院 项目：华为班 联系人：陈老师 联系电话：020-87112449 电子与信息学院 项目：阿里班 联系人：薛老师 联系电话：13302210203 微电子学院 项目：华为班 联系人：宋老师 联系电话：020-87114300-803 自动化科学与工程学院 项目：华为班 阿里班 联系人：宋老师 联系电话：020-87111289 计算机科学与工程学院 项目：华为班 联系人：姜老师 联系电话：020-39380286-3618 计算机科学与工程学院 项目：阿里班 联系人：罗老师 联系电话：13450440479 软件学院 项目：华为班 联系人：茹老师 联系电话：020-39380280 未来技术 项目：阿里班 联系人：胡老师 联系电话：020-87113164 材料科学与工程学院 项目：华为班 联系人：李老师 联系电话：020-22236029\"\n",
      "    }\n",
      "  ]\n",
      "}\n",
      "```\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "{'messages': [{'content': '请问华南理工大学与华为、阿里云2022级联合培养研究生的具体选拔人数是多少？',\n",
      "               'role': 'user'},\n",
      "              {'content': '华南理工大学与华为、阿里云2022级联合培养研究生的具体选拔人数如下： 工程博士：12人 '\n",
      "                          '专业学位硕士：30人 工程博士：10人 专业学位硕士：30人',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '请问华为技术有限公司硕士和博士联培生的津贴标准是多少？', 'role': 'user'},\n",
      "              {'content': '华为技术有限公司的联培生津贴标准如下： 硕士每月津贴税前6000元、住宿补贴税前1000元； '\n",
      "                          '博士每月津贴税前10000元、住宿补贴税前1000元。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '请问阿里云计算有限公司硕士和博士联培生的津贴标准是多少？', 'role': 'user'},\n",
      "              {'content': '阿里云计算有限公司的联培生津贴标准如下： '\n",
      "                          '硕博研究生每月津贴8000元，住宿补贴2000元（实习城市与学校城市异地情况适用）。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '请问联培过程中表现优异的研究生会有什么优惠？', 'role': 'user'},\n",
      "              {'content': '对于联培过程中表现优异的研究生，满足华为技术有限公司或阿里云计算有限公司招聘要求，尊重研究生意愿，优先录用。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '请问如何联系华南理工大学各相关院系项目的负责人？', 'role': 'user'},\n",
      "              {'content': '您可以通过以下方式联系华南理工大学各相关院系项目的负责人： 电子与信息学院 项目：华为班 '\n",
      "                          '联系人：陈老师 联系电话：020-87112449 电子与信息学院 项目：阿里班 联系人：薛老师 '\n",
      "                          '联系电话：13302210203 微电子学院 项目：华为班 联系人：宋老师 '\n",
      "                          '联系电话：020-87114300-803 自动化科学与工程学院 项目：华为班 阿里班 联系人：宋老师 '\n",
      "                          '联系电话：020-87111289 计算机科学与工程学院 项目：华为班 联系人：姜老师 '\n",
      "                          '联系电话：020-39380286-3618 计算机科学与工程学院 项目：阿里班 联系人：罗老师 '\n",
      "                          '联系电话：13450440479 软件学院 项目：华为班 联系人：茹老师 '\n",
      "                          '联系电话：020-39380280 未来技术 项目：阿里班 联系人：胡老师 '\n",
      "                          '联系电话：020-87113164 材料科学与工程学院 项目：华为班 联系人：李老师 '\n",
      "                          '联系电话：020-22236029',\n",
      "               'role': 'assistant'}]}\n",
      "Data has been written to /home/pci/work/gmx/cby_SCUT/chat_cby/agent/FTDatasets/华为技术有限公司、阿里云计算有限公司2022年联合培养研究生项目简介.txt\n",
      "\u001b[33mUser\u001b[0m (to chat_manager):\n",
      "\n",
      "请根据以下内容生成一个Alpaca数据集：\n",
      "\n",
      "2024年华南理工大学-鹏城实验室联合培养博士研究生专项计划招生简章 为服务国家创新驱动发展战略，助力粤港澳大湾区发展和深圳中国特色先行示范区建设，夯实鹏城实验室作为网络信息国家战略科技力量的基础平台，2024年鹏城实验室将联合华南理工大学共同开展博士研究生培养专项计划招生，实行本科直博、硕博连读及公开招考三种招生方式。公开招考博士研究生均通过申请考核制选拔方式择优录取。\n",
      "一、招生类别及规模 1.学术学位招生专业：计算机科学与技术（081200）、信息与通信工程（081000）、软件工程（083500） 2.专业学位招生专业：电子信息（085400） 3.招生规模：25人（最终计划数以教育部实际下达为准） 二、学习方式、学位授予及学习地点 1.所招收博士生录取类别为全日制非定向就业。博士研究生学制一般为4年，本科直博生为5年，最长学习年限等其他要求按华南理工大学研究生学籍管理规定执行。\n",
      "2.华南理工大学-鹏城实验室联合培养专项计划招收的博士研究生按照鹏城实验室与华南理工大学共同制定的联合培养计划，课程学习由华南理工大学组织，在华南理工大学完成，学位（毕业）论文工作结合鹏城实验室承担的国家重大科研任务在鹏城实验室（深圳）完成。\n",
      "3.符合华南理工大学毕业和学位要求者，准予毕业，由华南理工大学授予博士学位并颁发毕业证书和学位证书。\n",
      "三、报考条件 （一）基本条件 1.拥护中国共产党领导，具有正确政治方向，热爱祖国，愿意为社会主义现代化建设服务，遵纪守法的中华人民共和国公民。\n",
      "2.身心健康状况符合华南理工大学研究生入学体检要求。\n",
      "3.具有两名所报考学科专业（领域）教授（或相当专业技术职称的专家）的书面推荐。\n",
      "（二）除满足上述“（一）基本条件”和学院公布的申请考核制实施细则要求外，还需满足以下条件之一： 1.国家承认学历的应届硕士毕业生。考生报考时应已修完所有硕士课程并提供成绩单，录取当年入学前须取得国家承认的硕士毕业证书和学位证书。其中，攻读境外学历学位者须取得教育部留学服务中心出具的国（境）外学历学位认证书。\n",
      "2.已获硕士或博士学位人员。其中，获境外学历学位者须取得教育部留学服务中心出具的国（境）外学历学位认证书。\n",
      "（三）以硕博连读方式报考的考生，除满足上述“（一）基本条件”外，须为在校期间表现良好、具有博士研究生培养潜质的华南理工大学在读全日制硕士研究生，且须符合学校公布的申请条件。\n",
      "（四）以本科直博方式报考的考生，除满足上述“（一）基本条件”外，须为获得本科所在学校推荐免试资格的优秀应届本科毕业生，具有博士研究生培养潜质。\n",
      "四、报考流程 申请考核制报考流程及时间要求参见《华南理工大学2024年博士研究生招生简章》（https：//yz.scut.edu.cn/2023/1019/c30382a522096/page.htm）。申请考核制材料明细及整理要求详见《华南理工大学2024年博士研究生招生报考指引》。\n",
      "硕博连读攻读考生需提交材料见《关于招收2024年硕博连读攻读博士学位研究生的通知》（http：//www2.scut.edu.cn/graduate/2023/1027/c14562a522925/page.htm）。\n",
      "考生须于2023年11月22日前（以寄送邮戳为准）寄（送）申请材料至未来技术学院（寄送地址：广东省广州市番禺区兴业大道东777号华南理工大学广州国际校区未来技术学院B1C-419 ，常老师收）。\n",
      "五、审查考核 审查考核分为鹏城实验室考核和华南理工大学考核（包括申请材料审核和综合考核）两个阶段。具体由鹏城实验室与华南理工大学成立的联合工作组（以下简称“联合工作组”）组织。\n",
      "鹏城实验室考核主要包括材料审核和综合面试考核，具体安排另行通知。华南理工大学根据鹏城实验室考核意见择优确定进入学校考核的考生名单。华南理工大学考核（包括申请材料审核和综合考核）参照《华南理工大学2024年博士研究生招生简章》执行。\n",
      "六、录取与就业方式 （一）华南理工大学根据招生计划以及考生的学习能力、学术素养等，结合思想政治表现、业务素质以及身体健康状况，按照复试前公布的博士研究生招生复试录取办法，在综合考核后进行导师、考生双向选择，在计划范围内择优确定本专项计划拟录取名单。\n",
      "拟录取名单经审核后，分别在鹏城实验室研究生招生网和华南理工大学研究生招生网公示。\n",
      "获得拟录取资格的考生须签订入学承诺书。\n",
      "考生的资格审核结论和材料评审、复试成绩仅在本招生年度有效。未于本招生年度规定时间内参加审核、复试者，不予录取。被录取新生的入学资格只在当学年有效。\n",
      "（二）博士研究生录取类别为非定向就业，录取新生入学前必须将人事、组织关系、档案转入华南理工大学，全脱产学习。已就业的考生在录取通知书发放前还需提供原就业单位离职证明材料。毕业时采取毕业研究生与用人单位“双向选择”的方式自主择业。\n",
      "七、学费与奖助 录取后的考生按照华南理工大学全日制非定向博士研究生学费标准向华南理工大学缴纳学费。\n",
      "鹏城实验室为联培博士生专门设立鹏城科研津贴，按实验室相关办法执行。华南理工大学不再发放奖助学金。\n",
      "八、违规处理 考生必须保证申请材料的真实性和准确性，如有提交虚假材料、作弊及其他违纪行为，按《国家教育考试违规处理办法》（教育部令第33号）和华南理工大学有关文件处理。\n",
      "九、其他 1.博士研究生不依托实验室重大科研项目开展课题及论文研究，或因不可抗力等因素（如身体因素）而不符合联合培养的要求，通过鹏城实验室和华南理工大学教育或协调无效者，经博士研究生课题联合指导小组同意，华南理工大学审核通过后，可停止联合培养，原则上予以退学。\n",
      "2.未尽事宜参见《华南理工大学2024年博士研究生招生简章》及其相关的实施细则。\n",
      "3.本招生简章分别由华南理工大学和鹏城实验室负责解释。\n",
      "\n",
      "请按照指定的JSON格式生成至少10个中文条目。\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "\u001b[32m\n",
      "Next speaker: Reader\n",
      "\u001b[0m\n",
      "\u001b[33mReader\u001b[0m (to chat_manager):\n",
      "\n",
      "```json\n",
      "{\n",
      "  \"messages\": [\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请问华南理工大学-鹏城实验室联合培养博士研究生专项计划招生规模是多少？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"招生规模为25人（最终计划数以教育部实际下达为准）。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"博士研究生学制一般为多长时间？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"博士研究生学制一般为4年，本科直博生为5年，最长学习年限等其他要求按华南理工大学研究生学籍管理规定执行。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"华南理工大学-鹏城实验室联合培养专项计划招收的博士研究生的学位授予地点在哪里？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"学位（毕业）论文工作结合鹏城实验室承担的国家重大科研任务在鹏城实验室（深圳）完成。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"报考华南理工大学-鹏城实验室联合培养博士研究生需要满足哪些基本条件？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"基本条件包括拥护中国共产党领导，具有正确政治方向，热爱祖国，愿意为社会主义现代化建设服务，遵纪守法的中华人民共和国公民，以及身心健康状况符合华南理工大学研究生入学体检要求等。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"请问硕博连读攻读考生需提交材料的具体要求是什么？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"硕博连读攻读考生需提交材料，具体要求详见《关于招收2024年硕博连读攻读博士学位研究生的通知》。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"华南理工大学根据招生计划和考生的学习能力、学术素养等，如何进行录取？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"华南理工大学根据招生计划以及考生的学习能力、学术素养等，结合思想政治表现、业务素质以及身体健康状况，按照复试前公布的博士研究生招生复试录取办法，在综合考核后进行导师、考生双向选择，在计划范围内择优确定本专项计划拟录取名单。\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"user\",\n",
      "      \"content\": \"录取后的考生需要向华南理工大学缴纳什么费用？\"\n",
      "    },\n",
      "    {\n",
      "      \"role\": \"assistant\",\n",
      "      \"content\": \"录取后的考生按照华南理工大学全日制非定向博士研究生学费标准向华南理工大学缴纳学费。\"\n",
      "    }\n",
      "  ]\n",
      "}\n",
      "```\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "{'messages': [{'content': '请问华南理工大学-鹏城实验室联合培养博士研究生专项计划招生规模是多少？',\n",
      "               'role': 'user'},\n",
      "              {'content': '招生规模为25人（最终计划数以教育部实际下达为准）。', 'role': 'assistant'},\n",
      "              {'content': '博士研究生学制一般为多长时间？', 'role': 'user'},\n",
      "              {'content': '博士研究生学制一般为4年，本科直博生为5年，最长学习年限等其他要求按华南理工大学研究生学籍管理规定执行。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '华南理工大学-鹏城实验室联合培养专项计划招收的博士研究生的学位授予地点在哪里？',\n",
      "               'role': 'user'},\n",
      "              {'content': '学位（毕业）论文工作结合鹏城实验室承担的国家重大科研任务在鹏城实验室（深圳）完成。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '报考华南理工大学-鹏城实验室联合培养博士研究生需要满足哪些基本条件？', 'role': 'user'},\n",
      "              {'content': '基本条件包括拥护中国共产党领导，具有正确政治方向，热爱祖国，愿意为社会主义现代化建设服务，遵纪守法的中华人民共和国公民，以及身心健康状况符合华南理工大学研究生入学体检要求等。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '请问硕博连读攻读考生需提交材料的具体要求是什么？', 'role': 'user'},\n",
      "              {'content': '硕博连读攻读考生需提交材料，具体要求详见《关于招收2024年硕博连读攻读博士学位研究生的通知》。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '华南理工大学根据招生计划和考生的学习能力、学术素养等，如何进行录取？', 'role': 'user'},\n",
      "              {'content': '华南理工大学根据招生计划以及考生的学习能力、学术素养等，结合思想政治表现、业务素质以及身体健康状况，按照复试前公布的博士研究生招生复试录取办法，在综合考核后进行导师、考生双向选择，在计划范围内择优确定本专项计划拟录取名单。',\n",
      "               'role': 'assistant'},\n",
      "              {'content': '录取后的考生需要向华南理工大学缴纳什么费用？', 'role': 'user'},\n",
      "              {'content': '录取后的考生按照华南理工大学全日制非定向博士研究生学费标准向华南理工大学缴纳学费。',\n",
      "               'role': 'assistant'}]}\n",
      "Data has been written to /home/pci/work/gmx/cby_SCUT/chat_cby/agent/FTDatasets/2024年华南理工大学-鹏城实验室联合培养博士研究生专项计划招生简章.txt\n",
      "\u001b[33mUser\u001b[0m (to chat_manager):\n",
      "\n",
      "请根据以下内容生成一个Alpaca数据集：\n",
      "\n",
      "未来技术学院2023年博士研究生招生二次招生计划表 一、招生计划及要求 招生导师：胡滨 招生专业：信息与通信工程 计划数：1 生源要求：硕博连读/申请考核制 联系方式：huu@scut.edu.cn\n",
      "招生导师：陈岑 招生专业：信息与通信工程 计划数：1 生源要求：硕博连读/申请考核制 联系方式：chencen@scut.edu.cn\n",
      "招生导师：靳战鹏 招生专业：信息与通信工程 计划数：1 生源要求：硕博连读/申请考核制 联系方式：zjin@scut.edu.cn\n",
      "招生导师：蒋怀光 招生专业：信息与通信工程 计划数：1 生源要求：硕博连读/申请考核制 联系方式：hihuagong2021@scut.edu.cn\n",
      "招生导师：崔巍 招生专业：电子信息 计划数：1 生源要求：硕博连读/申请考核制 联系方式：aucuiwei@scut.edu.cn\n",
      "招生导师：郭锴凌 招生专业：电子信息 计划数：1 生源要求：硕博连读/申请考核制 联系方式：guokl@scut.edu.cn\n",
      "招生导师：林镇宏 招生专业：电子信息 计划数：1 生源要求：硕博连读/申请考核制 联系方式：zhenhong@scut.edu.cn\n",
      "招生导师：张怀东 招生专业：电子信息 计划数：1 生源要求：硕博连读/申请考核制 联系方式：huaidongz@scut.edu.cn\n",
      "招生导师：区俊辉 招生专业：电子信息 计划数：1 生源要求：硕博连读/申请考核制 联系方式：oujunhui@scut.edu.cn\n",
      "招生导师：吴斯 招生专业：电子信息 计划数：2 生源要求：硕博连读/申请考核制 联系方式：cswusi@scut.edu.cn\n",
      "\n",
      "请按照指定的JSON格式生成至少10个中文条目。\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "\u001b[32m\n",
      "Next speaker: Reader\n",
      "\u001b[0m\n",
      "\u001b[33mReader\u001b[0m (to chat_manager):\n",
      "\n",
      "```json\n",
      "{\n",
      "  \"messages\": [\n",
      "    {\"role\": \"user\", \"content\": \"请根据以下内容生成一个Alpaca数据集：\"},\n",
      "    {\"role\": \"assistant\", \"content\": \"未来技术学院2023年博士研究生招生二次招生计划表 一、招生计划及要求 招生导师：胡滨 招生专业：信息与通信工程 计划数：1 生源要求：硕博连读/申请考核制 联系方式：huu@scut.edu.cn\"}\n",
      "  ]\n",
      "}\n",
      "```\n",
      "\n",
      "--------------------------------------------------------------------------------\n",
      "{'messages': [{'content': '请根据以下内容生成一个Alpaca数据集：', 'role': 'user'},\n",
      "              {'content': '未来技术学院2023年博士研究生招生二次招生计划表 一、招生计划及要求 招生导师：胡滨 '\n",
      "                          '招生专业：信息与通信工程 计划数：1 生源要求：硕博连读/申请考核制 '\n",
      "                          '联系方式：huu@scut.edu.cn',\n",
      "               'role': 'assistant'}]}\n",
      "Data has been written to /home/pci/work/gmx/cby_SCUT/chat_cby/agent/FTDatasets/305-未来技术学院(更新).txt\n"
     ]
    }
   ],
   "source": [
    "# file_path = '/home/pci/work/gmx/cby_SCUT/chat_cby/docs/cleaned_txt/“华南理工大学-深圳华大基因研究院”生命科学创新学院介绍.txt'\n",
    "file_path_list = [\n",
    "    # '/home/pci/work/gmx/cby_SCUT/chat_cby/docs/cleaned_txt/“华南理工大学-深圳华大基因研究院”生命科学创新学院介绍.txt',\n",
    "    # '/home/pci/work/gmx/cby_SCUT/chat_cby/docs/cleaned_txt/未来技术学院2024年博士研究生招生申请考核制实施细则.txt',\n",
    "    '/home/pci/work/gmx/cby_SCUT/chat_cby/docs/cleaned_txt/组织机构-未来技术学院.txt',\n",
    "    '/home/pci/work/gmx/cby_SCUT/chat_cby/docs/cleaned_txt/未来技术学院 2024 年硕博连读博士研究生招生复试录取工作实施方案.txt',\n",
    "    '/home/pci/work/gmx/cby_SCUT/chat_cby/docs/cleaned_txt/未来技术学院2024年博士研究生招生申请考核制实施细则.txt',\n",
    "    '/home/pci/work/gmx/cby_SCUT/chat_cby/docs/cleaned_txt/华为技术有限公司、阿里云计算有限公司2022年联合培养研究生项目简介.txt',\n",
    "    '/home/pci/work/gmx/cby_SCUT/chat_cby/docs/cleaned_txt/2024年华南理工大学-鹏城实验室联合培养博士研究生专项计划招生简章.txt',\n",
    "    '/home/pci/work/gmx/cby_SCUT/chat_cby/docs/cleaned_txt/305-未来技术学院(更新).txt',\n",
    "]\n",
    "output_path = '/home/pci/work/gmx/cby_SCUT/chat_cby/agent/FTDatasets'\n",
    "for file_path in file_path_list:\n",
    "    generate(file_path, output_path)"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "as2",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.8.18"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
